智能论文笔记

A Comparative Study on Unsupervised Anomaly Detection for Time Series: Experiments and Analysis

Yan Zhao , Liwei Deng , Xuanhao Chen , Chenjuan Guo , Bin Yang , Tung Kieu , Feiteng Huang , Torben Bach Pedersen , Kai Zheng , Christian S. Jensen

分类：机器学习 | 人工智能

2022-09-10

社会过程的持续数字化转化为时间序列数据的扩散，这些数据涵盖了诸如欺诈检测，入侵检测和能量管理等应用，在这种应用程序中，异常检测通常对于启用可靠性和安全性至关重要。许多最近的研究针对时间序列数据的异常检测。实际上，时间序列异常检测的特征是不同的数据，方法和评估策略，现有研究中的比较仅考虑了这种多样性的一部分，这使得很难为特定问题设置选择最佳方法。为了解决这一缺点，我们介绍了有关数据，方法和评估策略的分类法，并使用分类法提供了无监督时间序列检测的全面概述，并系统地评估和比较了最先进的传统以及深度学习技术。在使用九个公开可用数据集的实证研究中，我们将最常用的性能评估指标应用于公平实施标准下的典型方法。根据分类法提供的结构化，我们报告了经验研究，并以比较表的形式提供指南，以选择最适合特定应用程序设置的方法。最后，我们为这个动态领域提出了研究方向。

translated by 谷歌翻译

Unsupervised Time Series Outlier Detection with Diversity-Driven Convolutional Ensembles -- Extended Version

David Campos , Tung Kieu , Chenjuan Guo , Feiteng Huang , Kai Zheng , Bin Yang , Christian S. Jensen

分类：机器学习

2021-11-22

随着社会，医疗，工业和科学过程的扫描数字化，正在部署传感技术，从而产生越来越多的时间序列数据，从而推动了一种新的新的或改进的应用。在此设置中，异常值检测通常很重要，而基于神经网络的解决方案存在，则它们会在精度和效率方面留出改进的空间。凭借实现这种改进的目的，我们提出了一个多样性驱动的卷积的集合。为了提高准确性，该合奏采用多个基本的异常值在卷积序列到序列自动泊车上构建的基本异常值检测模型，可以在时间序列中捕获时间依赖性。此外，一种新型的多样性驱动的训练方法在基本模型中保持多样性，目的是提高集合的准确性。为了提高效率，该方法在训练期间能够高度平行。此外，它能够将某些模型参数从一个基本模型转换为另一个基本模型，这减少了培训时间。我们使用现实世界多变量时间序列报告了广泛的实验，提供了对新方法的设计选择的深入了解，并提供了能够提高准确性和效率的证据。这是一个扩展版本的“无监督时间序列异常检测与分集驱动的卷积合奏”，以出现在PVLDB 2022中。

translated by 谷歌翻译

Machine Learning Approach to Polymerization Reaction Engineering: Determining Monomers Reactivity Ratios

Tung Nguyen , Mona Bavarian

分类：机器学习

2023-01-03

Here, we demonstrate how machine learning enables the prediction of comonomers reactivity ratios based on the molecular structure of monomers. We combined multi-task learning, multi-inputs, and Graph Attention Network to build a model capable of predicting reactivity ratios based on the monomers chemical structures.

translated by 谷歌翻译

Deep Learning Generates Synthetic Cancer Histology for Explainability and Education

James M. Dolezal , Rachelle Wolk , Hanna M. Hieromnimon , Frederick M. Howard , Andrew Srisuwananukorn , Dmitry Karpeyev , Siddhi Ramesh , Sara Kochanny , Jung Woo Kwon , Meghana Agni

分类：计算机视觉

2022-11-12

Artificial intelligence methods including deep neural networks (DNN) can provide rapid molecular classification of tumors from routine histology with accuracy that matches or exceeds human pathologists. Discerning how neural networks make their predictions remains a significant challenge, but explainability tools help provide insights into what models have learned when corresponding histologic features are poorly defined. Here, we present a method for improving explainability of DNN models using synthetic histology generated by a conditional generative adversarial network (cGAN). We show that cGANs generate high-quality synthetic histology images that can be leveraged for explaining DNN models trained to classify molecularly-subtyped tumors, exposing histologic features associated with molecular state. Fine-tuning synthetic histology through class and layer blending illustrates nuanced morphologic differences between tumor subtypes. Finally, we demonstrate the use of synthetic histology for augmenting pathologist-in-training education, showing that these intuitive visualizations can reinforce and improve understanding of histologic manifestations of tumor biology.

translated by 谷歌翻译

Online pseudo labeling for polyp segmentation with momentum networks

Toan Pham Van , Linh Bao Doan , Thanh Tung Nguyen , Duc Trung Tran , Quan Van Nguyen , Dinh Viet Sang

分类：计算机视觉

2022-09-29

语义分割是开发医学图像诊断系统的重要任务。但是，构建注释的医疗数据集很昂贵。因此，在这种情况下，半监督方法很重要。在半监督学习中，标签的质量在模型性能中起着至关重要的作用。在这项工作中，我们提出了一种新的伪标签策略，可提高用于培训学生网络的伪标签的质量。我们遵循多阶段的半监督训练方法，该方法在标记的数据集上训练教师模型，然后使用训练有素的老师将伪标签渲染用于学生培训。通过这样做，伪标签将被更新，并且随着培训的进度更加精确。上一个和我们的方法之间的关键区别在于，我们在学生培训过程中更新教师模型。因此，在学生培训过程中，提高了伪标签的质量。我们还提出了一种简单但有效的策略，以使用动量模型来提高伪标签的质量 - 训练过程中原始模型的慢复制版本。通过应用动量模型与学生培训期间的重新渲染伪标签相结合，我们在五个数据集中平均达到了84.1％的骰子分数（即Kvarsir，CVC-ClinicdB，Etis-laribpolypdb，cvc-colondb，cvc-colondb，cvc-colondb和cvc-300）和CVC-300）只有20％的数据集用作标记数据。我们的结果超过了3％的共同实践，甚至在某些数据集中取得了完全监督的结果。我们的源代码和预培训模型可在https://github.com/sun-asterisk-research/online学习SSL上找到

translated by 谷歌翻译

MoVQ: Modulating Quantized Vectors for High-Fidelity Image Generation

Chuanxia Zheng , Long Tung Vuong , Jianfei Cai , Dinh Phung

分类：计算机视觉

2022-09-19

尽管两阶段矢量量化（VQ）生成模型允许合成高保真性和高分辨率图像，但其量化操作员将图像中的相似贴片编码为相同的索引，从而为相似的相邻区域重复使用现有的解码器体系结构的相似相似区域的重复伪像。为了解决这个问题，我们建议将空间条件的归一化结合起来，以调节量化的向量，以便将空间变体信息插入嵌入式索引图中，从而鼓励解码器生成更真实的图像。此外，我们使用多通道量化来增加离散代码的重组能力，而无需增加模型和代码簿的成本。此外，为了在第二阶段生成离散令牌，我们采用掩盖的生成图像变压器（MaskGit）来学习压缩潜在空间中的基础先验分布，该分布比常规自动回归模型快得多。两个基准数据集的实验表明，我们提出的调制VQGAN能够大大提高重建的图像质量，并提供高保真图像的产生。

translated by 谷歌翻译

Bilevel Optimization for Just-in-Time Robotic Kitting and Delivery via Adaptive Task Segmentation and Scheduling

Yi-Shiuan Tung , Kayleigh Bishop , Bradley Hayes , Alessandro Roncone

分类：机器人

2022-09-17

套件是指准备和分组必要的零件和工具（或“套件”）以在制造环境中组装。自动化此过程可简化人工工人的组装任务，并提高效率。现有的自动化套件系统遵守脚本指示和预定义的启发式方法。但是，鉴于零件和逻辑延迟的可用性差异，现有系统的僵化性可以限制装配线的整体效率。在本文中，我们提出了一个双重优化框架，以使机器人能够执行基于任务分割的零件选择，套件布置和交付计划，以及时提供定制的套件 - 即在需要时正确。我们通过人类主题研究（n = 18）评估了提出的方法，涉及基于研究的数据构建平板家具桌和购物流仿真。我们的结果表明，与使用由任务图本身定义的刚性任务分割边界定义的基线方法相比，与基线方法相比，与基线方法相比，即将到来的套件系统更有效，对上游商店流量延迟有弹性，并且比较更好地优选。单个套件，包括组装单个单元所需的所有零件。

translated by 谷歌翻译

SoftGroup++: Scalable 3D Instance Segmentation with Octree Pyramid Grouping

Thang Vu , Kookhoi Kim , Tung M. Luu , Thanh Nguyen , Junyeong Kim , Chang D. Yoo

分类：计算机视觉

2022-09-17

现有的最新3D点云实例分割方法依赖于基于分组的方法，该方法指向获得对象实例。尽管产生准确的分割结果方面有所改善，但这些方法缺乏可扩展性，通常需要将大量输入分为多个部分。为了处理数百万点的场景，现有的最快方法软组\ cite {vu2022222222222222222222222222222222222222ggroup}需要数十秒钟，这是满意的。我们的发现是，$ k $ neart的邻居（$ k $ -nn）是分组的先决条件，是计算瓶颈。这种瓶颈严重使现场的推理时间恶化了很多。本文提出了软组++来解决此计算瓶颈，并进一步优化了整个网络的推理速度。 SoftGroup ++建立在软组上，这在三个重要方面有所不同：（1）执行OCTREE $ K $ -NN而不是Vanilla $ k $ -nn，以将时间复杂性从$ \ Mathcal {o}（n^2）缩短到$ \ Mathcal {o}（n \ log n）$，（2）执行金字塔缩放，适应性下降样本骨干输出以减少$ k $ -nn和分组的搜索空间，并且（3）执行后期的Devoxelization，延迟了Voxels的转换指向模型的结束，以使中间组件以低计算成本运行。在各种室内和室外数据集上进行了广泛的实验，证明了拟议的软组++的功效。值得注意的是，SoftGroup ++在一个前方的情况下通过单个前方进行了大量的场景，而无需将输入分为多个部分，从而丰富了上下文信息。特别是，SoftGroup ++达到2.4点AP $ _ {50} $改进，而$ 6 \ $ 6 \ times $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $。代码和训练有素的模型将公开可用。

translated by 谷歌翻译

Generalization Bounds for Deep Transfer Learning Using Majority Predictor Accuracy

Cuong N. Nguyen , Lam Si Tung Ho , Vu Dinh , Tal Hassner , Cuong V. Nguyen

分类：机器学习 | 人工智能

2022-09-13

我们分析了通过从源到目标任务转移学习训练的深度学习模型的新泛化界限。我们的边界利用一个称为多数预测器准确性的数量，可以从数据中有效地计算出来。我们表明我们的理论在实践中很有用，因为这意味着大多数预测指标的准确性可以用作可转移性度量，这一事实也通过我们的实验验证。

translated by 谷歌翻译

BayesLDM: A Domain-Specific Language for Probabilistic Modeling of Longitudinal Data

Karine Tung , Steven De La Torre , Mohamed El Mistiri , Rebecca Braga De Braganca , Eric Hekler , Misha Pavel , Daniel Rivera , Pedja Klasnja , Donna Spruijt-Metz , Benjamin M. Marlin

分类：机器学习 | 人工智能

2022-09-12

在本文中，我们介绍Bayesldm，这是一个用于贝叶斯纵向数据建模的系统，该系统由高级建模语言组成，具有针对复杂的多变量时间序列数据建模的特定功能，并与编译器相结合，可以生成优化的概率程序代码，以在指定模型中执行指定的推理。 Bayesldm支持贝叶斯网络模型的建模，其特定关注动态贝叶斯网络（DBN）的高效，声明性规范。 Bayesldm编译器将模型规范与可用数据和输出代码相结合，用于执行贝叶斯推断，以同时处理丢失的数据，同时处理未知模型参数。这些功能有可能通过抽象产生计算有效的概率推断代码的过程来显着加速域中的迭代建模工作流，这些迭代建模工作流程涉及复杂纵向数据的分析。我们描述了Bayesldm系统组件，评估表示和推理优化的效率，并提供了该系统在分析异质和部分观察到的移动健康数据的应用示例。

translated by 谷歌翻译